Un système modulaire d'acquisition automatique de traductions à partir du Web
نویسنده
چکیده
We present a method of automatic translation (French/English) of Complex Lexical Units (CLU) for aiming at extracting a bilingual lexicon. Our modular system is based on linguistic properties (compositionality, polysemy, etc.). Different aspects of the multilingual Web are used to validate candidate translations and collect new terms. We first build a French corpus of Web pages to collect CLU. Three adapted processing stages are applied for each linguistic property : compositional and non polysemous translations, compositional polysemous translations and non compositional translations. Our evaluation on a sample of CLU shows that our technique based on the Web can reach a very high precision. Mots-clés : Traduction Automatique, Unités Lexicales Complexes, Désambiguïsation lexicale, World Wide Web, Terminologie
منابع مشابه
Extraction métaheuristique d'une architecture à base de composants à partir d'un système orienté objet
Résumé. La modélisation et la représentation des architectures logicielles sont devenues une des phases principales du processus de développement de systèmes complexes. En effet, la représentation de l’architecture fournit de nombreux avantages pendant tout le cycle de vie du logiciel. Cependant pour beaucoup de systèmes existants, aucune représentation fiable de leurs architectures n’est dispo...
متن کاملUn Web sémantique de formation par questionnement
Résumé. Nous présentons dans cet article un EIAH conçu et développé selon des méthodes et techniques du Web sémantique et de l’ingénierie des connaissances. L'environnement d'apprentissage est conçu comme une mémoire de formation et le système que nous avons développé constitue un Web sémantique de formation (par extension de la notion de Web sémantique d’entreprise). Une approche d'acquisition...
متن کاملAnnotation Sémantique De Pages Web
L’annotation d’une page web constitue l’outil qui permet d’associer une sémantique au contenu de la page. Enrichir le partage d’information, améliorer les échanges et augmenter l’interopérabilité sur le web sont les principaux objectifs. En effet, avec la grande masse de données gérées à travers le monde et surtout avec l’avènement du web, l’annotation manuelle de ces pages est impossible. Dans...
متن کاملLes Triggers Inter-langues pour la Traduction Automatique Statistique. (Inter-lingual Triggers for Statistical Machine Translation)
Dans cet article, nous décrivons le concept de triggers inter-langues. Nous expliquons ensuite comment nous avons utilisé de tels triggers pour construire automatiquement un dictionnaire bilingue. Nous avons par la suite évalué notre dictionnaire bilingue en le comparant à deux dictionnaires existants, le premier fourni par ELRA et le second en libre accès sur Internet. Cependant, afin de rendr...
متن کاملEvaluation modulaire d'un système de questions-réponses sur un corpus de questions semi-spontanées
RÉSUMÉ. Cet article présente une évaluation séquentielle du système de questions-réponses modulaire et stochastique SQuALIA. L’évaluation se fonde sur un corpus de question semispontanées obtenu en faisant poser 20 questions de référence à des adultes francophones, non francophones ou dyslexiques. Les expériences montrent que ce sont les fautes d’orthographe qui ont le plus d’impact sur les mod...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- CoRR
دوره abs/0907.3781 شماره
صفحات -
تاریخ انتشار 2009